SEMAINE DU 24 JUIN 2024 au 28 JUIN 2024 :

OBJECTIF : Analyser la base de données

ANALYSE DE LA BASE DE DONNÉES

I ) Import de la nouvelle base de données formattée

# Import des données

data <- readRDS("/home/solene_petito/Bureau/Stage/Broken_devices/data/data1.rds") # base de données sur laquelle on va appliquer tous les changements

Broken_Devices_Data <- read.csv("/home/solene_petito/Bureau/Stage/Broken_devices/data/Broken-Devices-Data1-xlsx.csv",row.names=1) # base de données initiale sur laquelle on pourra se référer pour voir si les chgts ont bien été appliqués

# nombre d'observations
nb_obs <- nrow(data) # 968 

# nombre de variables 
nb_var <- ncol(data) # 164

II ) Systèmes d’exploitation et dysfonctionnements

La question posée était : Quel est le système d’exploitation de ce smartphone ?

Les réponses possibles étaient :

  • 1 : IOS (Apple)
  • 2 : Android
  • 3 : Autre
  • 4 : Je ne sais pas

La plupart des propriétaires de smartphone ont donc des android (67% des personnes de la base).

Regardons maintenant le nombre de personnes rencontrant des dysfonctionnements pour chaque systèmes d’exploitation :

##   Sytèmes.d.exploitation Nb_personnes Nb_personnes_dys Pourcentage_dys
## 1            IOS (Apple)          291              125              43
## 2                Android          652              264              40
## 3                  Autre           12                7              58
## 4         Je ne sais pas           13                4              31

Le diagramme à barres suivant permet de visualiser cette répartition :

III ) Etat du smartphone

1 ) Combien de personnes ont acheté leur smartphone neuf ? Combien l’ont eu d’occasion ? Combien l’on acheté reconditionné ?

Le graphe suivant nous apporte plus de détails :

Parmis ces différents états quelle est la part de dysfonctionnements ?

##             État Nb_personnes Nb_personnes_dys Pourcentage_dys
## 1           Neuf          792              316              40
## 2     D'occasion           88               45              51
## 3  Reconditionné           83               37              45
## 4 Je ne sais pas            5                2              40

La part de dysfonctionnements pour les smarthpones d’occasion est assez importante (50%), suivi des smartphones reconditionnés avec une part de 45% de dysfonctionnements.

2 ) Smartphone d’occasion

Parmis les smartphones d’occasion, quelle était leur durée d’utilisation avant que le propriétaire l’obtienne, et quel impact cela a eu sur le fait que le propriétaire rencontre des dysfonctionnements ou pas ?

Le graphe suivant nous donne plus de détails :

label_duree_occas <- c("Moins de 6 mois","Entre 6 mois et 1 an","Entre 1 et 2 ans","Entre 2 et 3 ans","Entre 3 et 5 ans","Plus de 5 ans","Je ne sais pas")

df =data[which(data$ETATSMARTPHONE==2 & data$RIDENTIFICATION_PROBLEMES!="27"),"UTILISATIONSMARTOCCAS"]
total = nrow(data[which(data$ETATSMARTPHONE==2 & data$RIDENTIFICATION_PROBLEMES!="27"),]) # 45 obs

don2 <- as.matrix(table(df))
Categorie <- factor(label_duree_occas, levels = label_duree_occas)

don <- data.frame(Categorie=Categorie, valeurs=round(don2[,1]*100/total),2)

p <- ggplot(don, aes(x = Categorie, y =valeurs )) +
  geom_bar(stat='identity',fill="turquoise4") +
  theme_minimal() +
  labs(title = "Ancienne durée du smartphone et pbs actuels",
       x = "Ancienne durée du smartphone d'occasion",
       y = "Pourcentage de personnes (%)") +
  theme(plot.title = element_text(hjust = 0.5, face = "bold",colour="turquoise4"),
        axis.title.x = element_text(face = "bold",colour="turquoise4"),
        axis.title.y = element_text(face = "bold",colour="turquoise4"),
        axis.text.x = element_text(angle = 45, hjust = 1, vjust = 1)) 

p_interactif <- ggplotly(p)

# Afficher le graphique interactif
p_interactif 

IV ) Groupement des thématiques par catégories

1 ) Groupement à plus grosses mailles

2 ) Groupement plus fin par thématiques

Les différentes catégories pourraient être :

  • Problèmes matériels : Problème avec l’écran, Problème de sensibilité du tactile, Problème avec l’appareil photo, Problème avec la lampe torche ou le flash, Problème avec le micro, Problème de son, Problème de prise jack, Problème de chargement, Problème de batterie, Problème de capteurs, Problème avec les boutons, Problème de vibreur

  • Problèmes de connectivité (ou de réseau) : Problème avec le GPS, Problème de Wi-Fi, Problème de Bluetooth ou de transferts de fichiers sans fil, Problème de téléphonie, Problème d’accès à Internet

  • Problèmes logiciels : Système d’exploitation non mis à jour, Applications ne pouvant pas être téléchargées ou mises à jour, Fonctionnalité qui ne marche plus, Dysfonctionnement logiciel, Problèmes avec des applications

  • Problèmes de performance : Problème de lenteur, Stockage saturé

  • Problèmes divers : Problème lié à une fonctionnalité manquante, Autre

1 ) Visualisation des catégories

Le tableau suivant donne le nombre de dysfonctionnements rencontrés pour chaque catégorie, et la part de chaque catégorie par rapport au nombre total de dysfonctionnements qui est de 832 :

##   Dysfonctionnements Nb_dys Pourcentage_dys
## 1           Matériel    392              47
## 2           Logiciel    160              19
## 3             Réseau    115              14
## 4        Performance    176              21
## 5             Divers     31               4

Le graphique à barres suivant permet de visualiser ces valeurs :

2 ) Types de gênes ressenties en fonction des catégories

Parmis ces différentes catégories quels sont les types de gênes ressentis pour chacun des dysfonctionnements, le tableau suivant indique ces différents types de gênes ressenties pour chacunes des catégories en pourcentage :

##   Dysfonctionnements Nb_dys Trés.gênant Plutôt.gênant Plutôt.pas.gênant
## 1           Matériel    392          31            46                19
## 2           Logiciel    160          29            50                19
## 3             Réseau    115          35            48                15
## 4        Performance    176          36            50                14
## 5             Divers     31          10            39                29
##   Pas.gênant.du.tout
## 1                  4
## 2                  2
## 3                  2
## 4                  0
## 5                 10

Le graphique à barres suivant permet de visualiser cette répartion :

La gêne ressentie parmis tous les dysfonctionnements et ce peut importe la catégorie, est en grande marjorité “plutôt gênante”.

3 ) Répartition des catégories pour chaque type de résolution

Quelle est la part de résolution des dysfonctionnments entre ces catégories ?

On remarque que dans chaque catégorie, les dysfonctionnements majoritaires sont ceux étant matériels, suivi de ceux étant liés à la performance. Les parts des différentes catégories semblent être assez égales entre chaque types de résolution.

Le tableau suivant donne plus de détails pour chaque types de résolution, avec une part en pourcentage du type de dysfonctionnement concerné pour chaque type de résolution :

##                                                    Résolution Dys_Materiel
## 1                               Oui et le problème est resolu           39
## 2                  Oui mais le problème na pas pu être résolu           40
## 3 Non, le problème s’est résolu tout seul au bout d’un moment           34
## 4                                    Non, peut être plus tard           51
## 5         Non, je ne pense pas tenter de résoudre le problème           42
##   Dys_Logiciel Dys_Reseau Dys_Performance Dys_Divers
## 1           18         18              21          4
## 2           18         14              26          1
## 3           29         17              17          3
## 4           14         11              22          2
## 5           20         12              21          4

4 ) Temps de cohabitation de ceux qui ont résolu le problème ou qui ont tenté de le résoudre en fonction des catégories de dysfonctionnements

Voici la répartition des temps de cohabitation pour les dysfonctionnements qui ont été résolus ou qui ont tenté d’être résolus :

Ce graphe nous montre que les problèmes de types matériel sont ceux qui ce règlent le plus vite.

V ) Temps de cohabitation de ceux qui n’ont pas résolu le problème

Pour déterminer le temps de cohabitation avec les dysfonctionnements des individus n’ayant pas résolu pas le problème, il a fallu prendre le mois et l’année d’obtention de leur téléphone, puis pour chaque dysfonctionnement rencontré, le temps approximatif au bout duquel il se rendu compte du problème, et déterminer le temps qui séparait ce temps approximatif du mois de novembre 2023 (date du questionnaire). Voici les temps de cohabitation pour les personnes n’ayant pas résolu les problèmes :

Voici la même représentation mais avec la part de chaque catégorie de dysfonctionnements :

La grande part de problèmes avec lesquels les personnes cohabitent sont les problèmes matériels.

Voici une autre représentation mais sous forme de nuage de points, afin de mieux voir la répartition des valeurs :

On remarque que le temmps de cohabitation avec le problème lorsqu’on ne l’a pas résolu est de deux ans en trés grande marjorité, suivi de entre 6 mois et 2 ans.

VI ) Nombre de dysfonctionnements

1 ) Nombre de dysfonctionnements rencontrés par année d’obtention

Il serait intéressant de savoir le nombre de personnes ayant rencontré 1,2,3 ou plus de dysfonctionnements en fonction de l’année d’obtention de leur smartphone. On se concentre sur les 5 dernières années car c’est celles pour lesquelles le nombre de dysfonctionnements rencontrés est important. Le graphe suivant nous apporte ces détails :

On observe que de 2018 à 2020, le nombre de dysfonctionnements recontrés par individus est de 2 en général, et que vers 2021 il passe à 1.

2 ) Nombre de dysfonctionnements par temps de cohabitation (de ceux qui ont tenté de résoudre le pb ou qui l’ont résolu)